AI TNT— 让一部分先用AI实现商业化

最近，开源大模型社区再次「热闹」了起来，主角是 AI 写作初创公司 HyperWrite 开发的新模型 Reflection 70B。

来自主题: AI资讯

5460 点击 2024-09-08 15:47

最近，Meta的多个工程团队联合发表了一篇论文，描述了在引入基于GPU的分布式训练时，他们如何为其「量身定制」专用的数据中心网络。

来自主题: AI技术研报

7426 点击 2024-08-29 16:10

随着LLM不断迭代，偏好和评估数据中大量的人工标注逐渐成为模型扩展的显著障碍之一。Meta FAIR的团队最近提出了一种使用迭代式方法「自学成才」的评估模型训练方法，让70B参数的Llama-3-Instruct模型分数超过了Llama 3.1-405B。

来自主题: AI资讯

3723 点击 2024-08-26 09:52

Meta加强推广Llama模型，谋求AI市场领导

来自主题: AI资讯

6305 点击 2024-08-23 10:10

微软Phi 3.5系列上新了！mini模型小而更美，MoE模型首次亮相，vision模型专注多模态。

来自主题: AI技术研报

4729 点击 2024-08-21 18:14

小模型崛起了。

来自主题: AI资讯

8973 点击 2024-08-16 21:04

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

5057 点击 2024-08-16 14:49

没有等来OpenAI的Q*/草莓项目的发布，一家名为MultiOn初创公司却抢先发布了名为Q的智能体。

来自主题: AI资讯

6981 点击 2024-08-14 18:05

如今一场席卷人工智能圈的“石油危机”已经出现，几乎每一家AI厂商都在竭力寻求新的语料来源，但再多的数据似乎也填不满AI大模型的胃口。更何况越来越多的内容平台意识到了手中数据的价值，纷纷开始敝帚自珍。为此，“合成数据”也成为了整个AI行业探索的新方向。

来自主题: AI资讯

6626 点击 2024-08-05 12:23

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

8986 点击 2024-08-02 14:26